home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / faq / sci / sci_lang < prev    next >
Text File  |  1994-03-29  |  37KB  |  748 lines

  1. Newsgroups: sci.lang,sci.answers,news.answers
  2. Path: bloom-beacon.mit.edu!hookup!swrinde!cs.utexas.edu!news.unt.edu!news.oc.com!internet.spss.com!markrose
  3. From: markrose@spss.com (Mark Rosenfelder)
  4. Subject: sci.lang FAQ (Frequently Asked Questions)
  5. Message-ID: <CnGDqF.5yp@spss.com>
  6. Followup-To: sci.lang
  7. Sender: news@spss.com
  8. Organization: SPSS Inc.
  9. Date: Wed, 30 Mar 1994 01:06:13 GMT
  10. Approved: news-answers-request@MIT.Edu
  11. Expires: Sun, 1 May 1994 00:00:00 GMT
  12. Lines: 733
  13. Xref: bloom-beacon.mit.edu sci.lang:8488 sci.answers:1026 news.answers:16999
  14.  
  15. Archive-name: sci-lang-faq
  16. Version: 2.6
  17. Last-modified: 25 Mar 1994
  18.  
  19. Except where noted, written by Michael Covington (mcovingt@ai.uga.edu)
  20. Maintained by Mark Rosenfelder (markrose@spss.com)
  21.  
  22.  
  23.       changes this month: 
  24.           added a section on common myths about language
  25.           added more information on acquiring electronic fonts
  26.       
  27.  
  28. NOTE: This FAQ file is fairly short.  Many good books and many important ideas
  29.       are left unmentioned.  All readers should be aware that linguistics
  30.       is a young science and that linguists rarely agree 100% on anything.
  31.  
  32. PHONETIC SYMBOLS IN ASCII: To represent phonetic symbols, see 
  33.       Evan Kirshenbaum's ASCII/IPA system, which is explained in 
  34.       separate postings.
  35.  
  36. ===============================================================================
  37. CONTENTS
  38.  
  39.  1. What is sci.lang for?
  40.  2. What is linguistics?
  41.  3. Does linguistics tell people how to speak or write properly?
  42.  4. What are some good books about linguistics?
  43.  5. How did language originate?
  44.  6. What is known about prehistoric language?
  45.  7. What do those asterisks mean?
  46.  8. How are present-day languages related?
  47.  9. Why do Hebrew and Yiddish [etc.] look alike if they aren't related?
  48. 10. How do linguists decide that languages are related?
  49. 11. What is Noam Chomsky's transformational grammar all about?
  50. 12. What is a dialect?  (Relation between dialects and languages.)
  51. 13. Are all languages equally complex, or are some more primitive than others?
  52. 14. What about artificial languages, such as Esperanto?          
  53. 15. What are some stories and novels that involve linguistics?
  54. 16. What about those Eskimo words for snow? (and other myths about language)
  55. 17. Where can I get an electronic IPA font (also Cyrillic, etc.)?
  56. ===============================================================================
  57. 1. What is sci.lang for?
  58.  
  59. Discussion of the scientific or historical study of human language(s).
  60. Note the "sci." prefix.  The main concern here is with _facts_ and
  61. theories accounting for them.
  62.  
  63. For advice on English usage, see alt.usage.english or misc.writing.
  64. For casual chatter about other languages see soc.culture.<whatever>.
  65.  
  66. Like all "sci." newsgroups, sci.lang is not meant to substitute for
  67. a dictionary or even a college library.  If the answer to your question
  68. can be looked up easily, then do so rather than using the net.
  69. If you don't have a library, then ask away, but explain your situation.
  70. ===============================================================================
  71. 2. What is linguistics?
  72.  
  73.   The scientific study of human language, including:
  74.      Phonetics (physical nature of speech)
  75.      Phonology (use of sounds in language)
  76.      Morphology (word formation)
  77.      Syntax (sentence structure)
  78.      Semantics (meaning of words & how they combine into sentences)
  79.      Pragmatics (effect of situation on language use)
  80.  
  81.   Or, carving it up another way:
  82.      Theoretical linguistics (pure and simple: how languages work)
  83.      Historical linguistics (how languages got to be the way they are)
  84.      Sociolinguistics (language and the structure of society)
  85.      Psycholinguistics (how language is implemented in the brain)
  86.      Applied linguistics (teaching, translation, etc.)
  87.      Computational linguistics (computer processing of human language)
  88.  
  89.   Some linguists also study sign language, non-verbal communication,
  90.   animal communication, and other topics peripheral to ordinary language.
  91. ===============================================================================
  92. 3. Does linguistics tell people how to speak or write properly?
  93.  
  94. No.  Linguistics is descriptive, not prescriptive.
  95. Linguistics can often supply facts which help people arrive at a
  96. recommendation or value judgement, but the recommendation or value
  97. judgement is not part of linguistic science itself.
  98. ===============================================================================
  99. 4. What are some good books about linguistics?
  100.  
  101. (These are cited by title and author only. Full ordering information
  102. can be obtained from BOOKS IN PRINT, available at most bookstores and
  103. at even the smallest public libraries.)
  104.  
  105.   CAMBRIDGE ENCYCLOPEDIA OF LANGUAGE, by David Crystal (1987) is a good place 
  106.      to start if you are new to this field.
  107.   LANGUAGE, by Edward Sapir (1921), is a readable survey of linguistics 
  108.      that is still worthwhile despite its age.
  109.   AN INTRODUCTION TO LANGUAGE, by Fromkin and Rodman (1974), is one of the 
  110.      best intro linguistics survey texts. (Read it!) There are many others.
  111.   CAMBRIDGE TEXTBOOKS IN LINGUISTICS (a series) consists of good,
  112.      modestly priced introductions to all the areas of linguistics.
  113.   Any encyclopedia will give you basic information about widely studied
  114.      languages, alphabets, etc.
  115. ===============================================================================
  116. 5. How did language originate?
  117.  
  118. Nobody knows.  Very little evidence is available.
  119. See however D. Bickerton, LANGUAGE AND SPECIES (1990).
  120. ===============================================================================
  121. 6. What is known about prehistoric language?
  122.  
  123. Quite a lot, if by "prehistoric" you'll settle for maybe 2000 years
  124. before the development of writing.  (Language is many thousands of years
  125. older than that.)
  126.  
  127. Languages of the past can be recovered by comparative reconstruction
  128. from their descendants.  The comparative method relies mainly on
  129. pronunciation, which changes very slowly and in highly systematic
  130. ways.  If you apply it to French, Spanish, and Italian, you 
  131. reconstruct late colloquial Latin with a high degree of accuracy;
  132. this and similar tests show us that the method works.
  133.  
  134. Also, if you use the comparative method on unrelated languages,
  135. you get nothing. So comparative reconstruction is a test of whether 
  136. languages are related (to a discernible degree).
  137.  
  138. The ancient languages Latin, Greek, Sanskrit, and several others form 
  139. a group known as "Indo-European."  Comparative reconstruction from 
  140. them gives a language called Proto-Indo-European which was spoken 
  141. around 2500 B.C.  Many Indo-European words can be reconstructed with 
  142. considerable confidence (e.g., *ekwos 'horse').  The grammar was 
  143. similar to Homeric Greek or Vedic Sanskrit.  Similar reconstructions are
  144. available for some other language families, though none has been as 
  145. thoroughly reconstructed as Indo-European.
  146. ===============================================================================
  147. 7. What do those asterisks mean?
  148.  
  149. Either of 2 things.
  150. An unattested, reconstructed word (such as Indo-European *ekwos);
  151. or an ungrammatical sentence (such as *Himself saw me).
  152. ===============================================================================
  153. 8. How are present-day languages related?
  154.                                                            [--Scott DeLancey]
  155.  
  156. This is an INCOMPLETE list of some of the world's language families.  More
  157. detailed classifications can be found in Voegelin and Voegelin, CLASSIFICATION
  158. AND INDEX OF THE WORLD'S LANGUAGES (1977), and M. Ruhlen, A GUIDE TO THE 
  159. WORLD'S LANGUAGES (1987).  (Note: Ruhlen's classification recognizes a 
  160. number of higher-order groups which most linguists regard as speculative).
  161.  
  162. A language family is a group of languages that have been proven to have
  163. descended from a common ancestral language.  Branches of families likewise
  164. represent groups of languages with a more recent common ancestor.  For 
  165. example, English, Dutch, and German have a common ancestor which we label
  166. Proto-West-Germanic, and thus belong to the West Germanic branch of Germanic.
  167. Icelandic and Norwegian are descended from Proto-North Germanic, a separate 
  168. branch of Germanic.  All the Germanic languages have a common ancestor, 
  169. Proto-Germanic; farther back, this ancestor was descended from Proto-Indo-
  170. European, as were the ancestors of the Italic, Slavic, and other branches.
  171.  
  172. Not all languages are known to be related to each other.  It is possible that 
  173. they are related but the evidence of relationship has been lost; it's also 
  174. possible they arose separately.  It is likely that some of the families 
  175. listed here will eventually turn out to be related to one another.
  176.  
  177. While low-level close relationships are easy to demonstrate, higher-order 
  178. classification proposals must rely on more problematic evidence and tend to 
  179. be controversial.  Recently linguists such as Joseph Greenberg and Vitalij 
  180. Shevoroshkin have attracted attention both in linguistic circles and in the 
  181. popular press with claims of larger genetic units, such as Nostratic 
  182. (comprising Indo-European, Uralic, Altaic, Dravidian, and Afroasiatic) or 
  183. Amerind (to include all the languages of the New World except Na-Dene and
  184. Eskimo-Aleut).  Most linguists regard these hypotheses as having a grossly 
  185. insufficient empirical foundation, and argue that comparisons at that depth 
  186. are not possible using available methods of historical linguistics.
  187.  
  188. This list isn't intended to be exhaustive, even for families like Germanic
  189. and Italic.  Nor is it the last word on what's a "language"; see question 12.
  190.  
  191.   Note: English is not descended from Latin.
  192.         English is a Germanic language with a lot of Latin vocabulary,
  193.         borrowed from French in the Middle Ages.
  194.  
  195. INDO-EUROPEAN
  196.     GERMANIC
  197.       North Germanic:  Icelandic, Norwegian / Swedish / Danish
  198.       East Germanic:  Gothic (extinct)
  199.       West Germanic:  English, Dutch, German, Yiddish
  200.     ITALIC
  201.       Osco-Umbrian:  Oscan, Umbrian (extinct languages of Italy)
  202.       Latin and its modern descendants (Italian, Spanish, Portuguese, 
  203.          Catalan, Rumanian, French, etc.)
  204.     CELTIC
  205.       P-Celtic:  Welsh, Breton, Cornish
  206.       Q-Celtic:  Irish, Scots Gaelic, Manx
  207.       Some extinct European languages were also Celtic, notably those of Gaul
  208.     HELLENIC:  Greek (ancient and modern)
  209.     SLAVIC:  Russian, Bulgarian, Polish, Czech, Serbo-Croatian, etc. 
  210.          (not Rumanian or Albanian)
  211.     BALTIC:  Lithuanian and Latvian
  212.     INDO-IRANIAN
  213.       Indic:  Sanskrit and its modern descendants (Hindi-Urdu, 
  214.          Gypsy (Romany), Bengali, etc.)
  215.       Iranian: Persian (ancient and modern), Pashto (Afghanistan), others
  216.     ALBANIAN:  Albanian
  217.     ARMENIAN:  Armenian
  218.     TOKHARIAN (an extinct language of NW China)
  219.     HITTITE (extinct language of Turkey)
  220.  
  221. AFRO-ASIATIC
  222.     SEMITIC:  Arabic, Hebrew (not Yiddish; see above), Aramaic, Amharic
  223.       and other languages of Ethiopia
  224.     CHADIC:  languages of northern Africa, e.g. Hausa
  225.     CUSHITIC:  Somali, other languages of eastern Africa
  226.     EGYPTIAN:  Ancient Egyptian
  227.     BERBER:  languages of North Africa
  228.  
  229. NIGER-KORDOFANIAN:  includes most of the languages of sub-Saharan 
  230.     Africa.  Most of the languages are in the NIGER-CONGO branch; the
  231.     most widely known subgroup of N-G is BANTU (Swahili, Zulu, Xhosa, etc.) 
  232.  
  233. URALIC (=FINNO-UGRIAN)
  234.     Finnish, Estonian, Saami (Lapp), Hungarian, and several 
  235.     languages of central Russia
  236.  
  237. MONGOL:  Mongolian, Buryat, Kalmuck, etc.
  238. TURKIC:  Turkish, Azerbaijani, Kazakh, and other languages of Central Asia
  239.  
  240.     Some linguists group the Mongol and Turkic families together as ALTAIC.
  241.     Rather more controversially, some add Korean and Japanese to this group.
  242.  
  243.     It has been claimed that URALIC and ALTAIC are related (as URAL-ALTAIC),
  244.     but this idea is not widely accepted.
  245.  
  246. DRAVIDIAN:  languages of southern India, including Tamil, Telugu, etc.
  247.  
  248. SINO-TIBETAN
  249.     SINITIC:  Chinese (several "dialects", or arguably distinct languages:
  250.       Mandarin, Wu (Shanghai), Min (Hokkien [Fujian], Taiwanese), 
  251.       Yue (Cantonese), Hakka, Gan, Xiang
  252.     TIBETO-BURMAN: Tibetan, Burmese, various languages of Burma,
  253.       China, India, and Nepal
  254.  
  255. AUSTROASIATIC
  256.     MON-KHMER:  Vietnamese, Khmer (Cambodian), and various minority 
  257.       and tribal languages of Southeast Asia
  258.     MUNDA:  tribal languages of eastern India
  259.  
  260. AUSTRONESIAN
  261.     Malay-Indonesian, other languages of Indonesia (Javanese, etc.)
  262.     Philippine languages: Tagalog, Ilocano, Bontoc, etc.
  263.     Aboriginal languages of Taiwan (Tsou, etc.)
  264.     Polynesian languages: Hawaiian, Maori, Samoan, Tahitian, etc.
  265.     Micronesian:  Chamorro (spoken in Guam), Yap, Truk, etc.
  266.     Malagasy (spoken in Madagascar)
  267.   Most of these languages fall in a branch called MALAYO-POLYNESIAN
  268.  
  269. JAPANESE:  A number of linguists argue that Japanese is ALTAIC; others,
  270.     that it is most closely related to AUSTRONESIAN, or that it represents 
  271.     a mixture of AUSTRONESIAN and ALTAIC elements.
  272.  
  273. TAI-KADAI:  Thai, Lao, and other languages of southern China and 
  274.     northern Burma.  Possibly related to AUSTRONESIAN.  
  275.     An outdated hypothesis that TAI is part of SINO-TIBETAN is still 
  276.     often found in reference works and introductory texts.
  277.  
  278. AUSTRALIA:  the Aboriginal languages of Australia are conservatively 
  279.     classified into 26 families, the largest being PAMA-NYUNGAN, consisting
  280.     of about 200 languages originally spoken over 80-90% of Australia.
  281.  
  282. A large number of language families are found in North and South America.
  283. There are numerous proposals which group these into larger units, some of
  284. which will probably be demonstrated in time.  To date no New World language 
  285. has been proven to be related to any Old World family.  The larger North 
  286. American families include:
  287.  
  288. ESKIMO-ALEUT:  two Eskimo languages and Aleut.
  289. ATHAPASKAN:  most of the languages of Alaska and northwestern Canada,
  290.     also includes Navajo and Apache.  Eyak (in Alaska) is related to
  291.     Athapaskan; some linguists put these together with Tlingit and Haida
  292.     in a NA-DENE family.
  293. ALGONQUIAN:  most of Canada and the Northeastern U.S., includes
  294.     Cree, Ojibwa, Cheyenne, Blackfoot
  295. IROQUOIAN:  the languages of NY state (Mohawk, Onondaga, etc.) and Cherokee
  296. SIOUAN:  includes Dakota/Lakhota and other languages of the Plains
  297.     and Southeast U.S.
  298. MUSKOGEAN: Choctaw, Alabama, Creek, Mikasuki (Seminole) and other
  299.     languages of the southeast U.S.
  300. UTO-AZTECAN:  a large family in Mexico and the Southwestern U.S., 
  301.     includes Nahuatl (Aztec), Hopi, Comanche, Paiute, etc.
  302. SALISH:  languages of Washington and British Columbia
  303. HOKAN:  languages of California and Mexico; a controversial grouping
  304. PENUTIAN:  languages of California and Oregon; also controversial
  305.  
  306. Work on documentation and classification of South American languages still 
  307. has a long way to go.  Generally recognized families include:
  308.  
  309. ARAWAKAN, TUCANOAN, TUPI-GUARANI (including Guarani, a national language
  310. of Paraguay), CARIBAN, ANDEAN (including Quechua and Aymara)
  311.  
  312. LANGUAGE ISOLATES:  A number of languages around the world have never been
  313. successfully shown to be related to any others-- in at least some cases 
  314. because any related languages have long been extinct.  The most famous 
  315. isolate is Basque, spoken in northern Spain and southern France; it is 
  316. apparently a survival from before the Indo-Europeanization of Europe.
  317. ===============================================================================
  318. 9. Why do  Hebrew and Yiddish
  319.            Japanese and Chinese
  320.            Persian and Arabic
  321.    look so much alike if they aren't related?
  322.  
  323. Distinguish LANGUAGE from WRITING SYSTEM.
  324. In each of these cases one language has adopted part or all of the 
  325. writing system of an unrelated language.
  326.  
  327. (To a Chinese, English and Finnish look alike, because they're written 
  328. in the same alphabet.  Yet they are not historically related.)
  329.  
  330. An excellent introduction to writing systems is Geoffrey Sampson's
  331. WRITING SYSTEMS (1985).
  332. ===============================================================================
  333. 10. How do linguists decide that languages are related?           [--markrose]
  334.  
  335. When linguists say that languages are related, they're not just remarking 
  336. on their surface similarity; they're making a technical statement or claim
  337. about their history-- namely, that they can be regularly derived from a 
  338. common parent language.
  339.  
  340. Proto-languages are reconstructed using the comparative method.  The 
  341. first stage is to inspect and compare large amounts of vocabulary from the 
  342. languages in question.  Where possible we compare entire _paradigms_ (sets 
  343. of related forms, such as the those of the present active indicative in 
  344. Latin), rather than individual words.
  345.  
  346. The inspection should yield a set of regular sound correspondences between 
  347. the languages.  By regular, we mean that the same correspondences are 
  348. consistently observed in identical phonetic environments.  Finally, _sound 
  349. changes_ are formulated: language-specific rules which specify how the 
  350. original common form changed in order to produce those observed in each 
  351. descendent language.
  352.  
  353. Applying the comparative method to the Romance languages, we might find
  354.  
  355.   'I sense'  Sard /sento/  French /sa~/   Italian /sento/   Spanish /sjEnto/
  356.   'sleep'         /sonnu/         /som/           /sonno/           /suEn^o/
  357.  
  358.   'hundred'       /kentu/         /sa~/           /tSento/          /sjEnto/
  359.   'five'          /kimbe/         /sE~k/          /tSinko/          /sinko/
  360.  
  361.   'I run'         /kurro/         /kur/           /korro/           /korro/
  362.   'story'         /kontu/         /ko~t@/         /konto/           /kuEnto/
  363.  
  364. and hundreds of similar examples.  We see some correspondences--
  365.  
  366.   (1)        Sard /s/      French /s/     Italian /s/       Spanish /s/
  367.   (2)             /k/             /s/             /tS/              /s/
  368.   (3)             /k/             /k/             /k/               /k/
  369.  
  370. but they seem to conflict: does Sard /k/ correspond to Spanish /s/ or /k/?
  371. Does French /s/ correspond to Italian /s/ or /tS/?
  372.  
  373. In fact we will find that the correspondences are regular, once we observe
  374. that (2) is seen before a front vowel (i or e), while (3) is seen in other
  375. environments.  Alternations within paradigms, such as It. /diko/ 'I say' 
  376. vs. /ditSe/ 'says', will help us make and confirm such generalizations.
  377.  
  378. We may interpret these now-regular correspondences as indicating that an 
  379. initial /s/ in the proto-language has been retained in all four languages, 
  380. and likewise initial /k/ in Sard; but that /k/ changed to /s/ or /tS/ in 
  381. the other languages in the environment of a front vowel.
  382.  
  383. Actually, this process is iterative.  For instance, at first glance we 
  384. might think that German _haben_ and Latin _habere_ 'have' are obvious 
  385. cognates.  However, after noting the regular correspondence of German h to 
  386. Latin c, we are forced to change our minds, and look to _capere_ 'seize' 
  387. as a better cognate for _haben_.
  388.  
  389. Thus, similarity of words is only a clue, and perhaps a misleading one.
  390. Linguists conclude languages are related, and thus derive from a common
  391. ancestor, only if they find *regular* sound correspondences between them.
  392.  
  393. To complicate things, derivations may be obscured by irregular changes,
  394. such as dissimilation, borrowing, or analogical change.  For instance, 
  395. the normal development of Middle English _kyn_ is 'kine', but this word
  396. has been largely replaced by 'cows', formed from 'cow' (ME _cou_) on the 
  397. analogy of word-pairs like stone : stones.  Analogy often serves to reduce 
  398. irregularities in a language (here, an unusual plural).
  399.  
  400. _Borrowing_ refers to taking words from other languages, as English has
  401. taken 'search' and 'garage' from French, 'paternal' from Latin, 'anger' from 
  402. Old Norse, and 'tomato' from Nahuatl.  How do we know that English doesn't
  403. derive from French or Nahuatl?  The latter case is easy to eliminate: 
  404. regular sound correspondences can't be set up between English and Nahuatl.
  405.  
  406. But English has borrowed so heavily from French that regular correspondences 
  407. do occur.  Here, however, we find that the French borrowings are thickest in 
  408. government, legal, and military domains; while the basic vocabulary (which 
  409. languages borrow less frequently) is more akin to German.  Paradigmatic 
  410. correspondences like sing/sang/sung vs. singen/sang/gesungen also help show
  411. that the Germanic words are inherited, the French ones borrowed.
  412. ===============================================================================
  413. 11. What is Noam Chomsky's transformational grammar all about?
  414.  
  415. Several things; it really comprises several layers of theory:
  416.  
  417. (1) The hypothesis that much of the structure of human language is
  418. inborn ("built-in") in the human brain, so that a baby learning to
  419. talk only has to learn the vocabulary and the structural "parameters"
  420. of his native language -- he doesn't have to learn how language works
  421. from scratch.
  422.  
  423. This is well supported and widely believed; main evidence consists of:
  424.   - The fact that babies learn to talk remarkably well from what seems
  425.      to be inadequate exposure to language; it can be shown in detail
  426.      that babies acquire some rules of grammar that they could never
  427.      have "learned" from what is available to them, if the structure of
  428.      language were not partly built-in.
  429.   - The fact that the structure of language on different levels
  430.      (vocabulary, ability to connect words, etc.) can be lost by injury
  431.      to specific areas of the brain.
  432.   - The fact that there are unexpected structural similarities between
  433.      all known languages.
  434. For detailed exposition see Cook, CHOMSKY'S UNIVERSAL GRAMMAR (1988), and
  435. Newmeyer, GRAMMATICAL THEORY: ITS LIMITS AND POSSIBILITIES.
  436.  
  437. (2) The hypothesis that to adequately describe the grammar of a human
  438. language, you have to give each sentence at least two different structures, 
  439. called "deep structure" and "surface structure", together with rules
  440. called "transformations" that relate them. 
  441.  
  442. This is hotly debated.  Some theories of grammar use two levels and
  443. some don't.  Chomsky's original monograph, SYNTACTIC STRUCTURES (1957),
  444. is still well worth reading; this is what it deals with.
  445.  
  446. (3) Chomsky's name is associated with specific flavors of transformational
  447. grammar.  The model elaborated over the last few years is called GB
  448. (government and binding) theory; however, Chomsky's 1992 paper on Minimalism
  449. contains significant departures from earlier work in GB.
  450.  
  451. Bill Turkel (bill@hivnet.ubc.ca) runs a mailing list on Minimalism; e-mail
  452. him for more information. 
  453.  
  454. (4) Some people think Chomsky is the source of the idea that grammar ought
  455. to be viewed with mathematical precision.  (Thus there are occasional
  456. vehement anti-Chomsky polemics such as THE NEW GRAMMARIAN'S FUNERAL, which
  457. are really polemics against grammar per se.)
  458.  
  459. Although Chomsky contributed some valuable techniques, grammarians have
  460. _always_ believed that grammar was a precise, mechanical thing.
  461. ===============================================================================
  462. 12. What is a dialect?
  463.                                                               [--M.C. + M.R.]
  464. A dialect is any variety of a language spoken by a specific community of
  465. people. Most languages have many dialects.
  466.  
  467. Everyone speaks a dialect.  In fact everyone speaks an _idiolect_, i.e.,
  468. a personal language.  (Your English language is not quite the same as
  469. my English language, though they are probably very, very close.)
  470.  
  471. A group of people with very similar idiolects are considered to be
  472. speaking the same dialect.  Some dialects, such as Standard American
  473. English, are taught in schools and used widely around the world.
  474. Others are very localized.  
  475.  
  476. Localized or uneducated dialects are _not_ merely failed attempts to speak
  477. the standard language.  William Labov and others have demonstrated, for
  478. example, that the speech of inner-city blacks has its own intricate
  479. grammar, quite different in some ways from that of Standard English.
  480.  
  481. It should be emphasized that linguists do not consider some dialects 
  482. superior to others-- though speakers of the language may do so;
  483. and linguists do study people's attitudes toward language, since 
  484. these have a strong effect on the development of language.
  485.  
  486. Linguists call varieties of language "dialects" if the speakers can
  487. understand each other and "languages" if they can't.  For example,
  488. Irish English and Southern American English are dialects of English,
  489. but English and German are different languages (though related).
  490.  
  491. This criterion is not always as easy to apply as it sounds.
  492. Intelligibility may vary with familiarity and interest, or may depend
  493. on the subject.  A more serious problem is the _dialect continuum_: a
  494. chain of dialects such that any two adjoining dialects are mutually
  495. intelligible, but the dialects at the ends are not.  Speakers of
  496. Belgian Dutch, for instance, can't understand Swiss German, but
  497. between them there lies a continuum of mutually intelligible dialects.
  498.  
  499. Sometimes the use of the terms "language" or "dialect" is politically
  500. motivated.  Norwegian and Danish (being mutually intelligible) are
  501. dialects of the same language, but are considered separate languages
  502. because of their political independence.  By contrast, Mandarin and
  503. Cantonese, which are mutually unintelligible, are often referred to
  504. as "dialects" of Chinese, due to the political and cultural unity of
  505. China, and because they share a common _written_ language.
  506.  
  507. Because of such problems, some linguists reject the mutual
  508. intelligibility criterion; but they do not propose to return to
  509. arguments on political and cultural grounds.  Instead, they prefer
  510. not to speak of dialects and languages at all, but only of different
  511. varieties, with varying degrees of mutual intelligibility.
  512. ===============================================================================
  513. 13. Are all languages equally complex, or are some more primitive than others?
  514.  
  515. Obviously, the size of vocabulary and the variety and sophistication of
  516. literary forms will depend on the culture.
  517.  
  518. But the _grammar_ of all languages is about equally complex.  Even people with
  519. a very "primitive" material culture, such as the Australian Aborigines, speak
  520. complex languages.
  521.  
  522. Different languages put their complexity in different places.  English has
  523. complex, intricate sentence structure, but simple morphology (each word has
  524. only a few forms).  Finnish has freer syntax but much more complex morphology.
  525.  
  526. The only really simple languages are _pidgins_ and _creoles_, which result
  527. when speakers of different languages are suddenly forced to live and work
  528. together. They quickly arrive at a very simple language with vocabulary from
  529. both languages, and a simple grammar of a specific kind (e.g., they are
  530. likely to use repetition to express plurals).  Such a language is called
  531. a _pidgin_ initially, then becomes a _creole_ when babies are born who
  532. acquire it as a native language.
  533. ===============================================================================
  534. 14. What about artificial languages, such as Esperanto?          [--markrose]
  535.  
  536. Hundreds of constructed languages have been devised in the last few centuries.
  537. Early proposals, such as those of Lodwick (1647), Wilkins, or Leibniz, were 
  538. attempts to devise an ideal language based on philosophical classification 
  539. of concepts, and used wholly invented words.  Most were too complex to learn,
  540. but one, Jean Francois Sudre's Solresol, achieved some popularity in the last
  541. century; its entire vocabulary was built from the names of the notes of 
  542. the musical scale, and could be sung as well as spoken.
  543.  
  544. Later the focus shifted to languages based on existing languages, with a 
  545. polyglot (usually European) vocabulary and a simplified grammar, whose purpose
  546. was to facilitate international communication.  Johann Schleyer's Volapu"k 
  547. (1880) was the first to achieve success; its name is based on English 
  548. ("world-speech"), and reflects Schleyer's notions of phonetic simplicity.  
  549.  
  550. It was soon eclipsed by Ludwig Zamenhof's Esperanto (1887), whose grammar 
  551. was simpler and its vocabulary more recognizable.  Esperanto has remained 
  552. the most successful and best-known artificial language, with a million or 
  553. more speakers and a voluminous literature; children of Esperantists have 
  554. even learned it as a native language.
  555.  
  556. Its relative success hasn't prevented the appearance of new proposals, such
  557. as Ido, Interlingua, Occidental, and Novial.  There have also been attempts
  558. to simplify Latin (Latino Sine Flexione, 1903) and English (Basic English, 
  559. 1930) for international use.  The recent Loglan and Lojban, based on 
  560. predicate logic, may represent a revival of a priori language construction.
  561.  
  562. See also Andrew Large, THE ARTIFICIAL LANGUAGE MOVEMENT (1985); Mario Pei, 
  563. ONE LANGUAGE FOR THE WORLD; Detlev Blanke, INTERNATIONALE 
  564. PLANSPRACHEN (in German).
  565.  
  566. There is a newsgroup, soc.culture.esperanto, dedicated to Esperanto.
  567. The FAQ for this group contains pointers to mailing lists for other
  568. constructed languages.
  569. ===============================================================================
  570. 15. What are some stories and novels that involve linguistics?    [--markrose]
  571.  
  572. The following list is by no means exhaustive.  It's based on James Myers'
  573. list of books, which was compiled the the last time the subject came up on 
  574. sci.lang.  Additions and corrections are welcome; please suggest the
  575. approximate category and give the publication date, if possible.
  576.  
  577. ALIENS AND LINGUISTS: Language Study and Science Fiction, by Walter Meyers
  578. (1980) contains a general discussion and lists more works.
  579.  
  580. alien languages
  581.  
  582.     "Tlon, Uqbar, Tertius Orbis" in FICCIONES - Jorge Luis Borges (1956)
  583.     BABEL-17 - Samuel R. Delany (1966)
  584.     FLIGHT OF THE DRAGONFLY - Robert L. Forward
  585.     THE HAUNTED STARS - Edmond Hamilton
  586.     INHERIT THE STARS - James P. Hogan
  587.     "Omnilingual", in FEDERATION - H. Beam Piper
  588.     CONTACT - Carl Sagan (1985)
  589.     PSYCHAOS - E. P. Thompson
  590.     "A Martian Odyssey" in SF HALL OF FAME - Stanley Weinbaum (1934)
  591.     "A Rose for Ecclesiastes" in SF HALL OF FAME - Roger Zelazny (1963)
  592.  
  593. futuristic varieties of English
  594.  
  595.     A CLOCKWORK ORANGE - Anthony Burgess (1963?)
  596.     HELLFLOWER - eluki bes shahar
  597.     THE INHERITORS - William Golding
  598.     THE MOON IS A HARSH MISTRESS - Robert Heinlein (1966)
  599.     RIDDLEY WALKER - Russel Hoban
  600.     1984 - George Orwell (1948)
  601.  
  602. other invented languages
  603.  
  604.     NATIVE TONGUE - Suzette Haden Elgin
  605.     "Gulf" in ASSIGNMENT IN ETERNITY - Robert A. Heinlein (1949)
  606.     DUNE - Frank Herbert (1965?)
  607.     THE VOID-CAPTAIN'S TALE - Norman Spinrad
  608.     THE LORD OF THE RINGS - J R R Tolkien (1965)
  609.     THE MEMORANDUM - Vaclav Havel (1966)
  610.     THE LANGUAGES OF PAO - Jack Vance (1957)
  611.  
  612. linguist heroes
  613.  
  614.     DOUBLE NEGATIVE - David Carkeet
  615.     THE FULL CATASTROPHE - David Carkeet
  616.     PYGMALION - George Bernard Shaw (1912)
  617.     THE POISON ORACLE - Peter Dickinson (1974)
  618.     HANDS ON - Andrew Rosenheim (1992)
  619.  
  620. animal language
  621.  
  622.     WATERSHIP DOWN - Richard Adams
  623.     TARZAN OF THE APES - Edgar Rice Burroughs
  624.     CONGO - Michael Crichton
  625.  
  626. use of linguistic theory
  627.  
  628.     SNOW CRASH - Neal Stephenson (1992)
  629.     GULLIVER'S TRAVELS - Jonathan Swift (1726)
  630.     THE EMBEDDING - Ian Watson (1973)
  631.  
  632. other
  633.  
  634.     THE TROIKA INCIDENT - James Cooke Brown
  635.     ETXEMENDI - Florence Delay
  636.     SO YOU WANT TO BE A WIZARD - Diane Duane
  637.     TONGUES OF THE MOON - Philip Jose Farmer
  638.     THE DISPOSSESSED - Ursula LeGuin (1974)
  639. ===============================================================================
  640. 16. What about those Eskimo words for snow? (and other myths about language)
  641.                                                                [--markrose]
  642.  
  643.    "The Eskimos have hundreds of words for snow."
  644.  
  645. This story is constantly being repeated, with various numbers given,
  646. despite the fact that it has no basis at all.  No one who repeats this
  647. pseudo-factoid can list the hundreds of words for you, or even cite a 
  648. work that does.  They just heard it somewhere.
  649.  
  650. The anthropologist Laura Martin has traced the development of this myth
  651. (including the steady growth in the number of words claimed).  Geoffrey
  652. Pullum summarizes her report in THE GREAT ESKIMO VOCABULARY HOAX (1991).
  653.  
  654. How many words are there really?  Well, the Yup'ik language in particular
  655. has about two dozen roots describing snow or things related to snow.  This
  656. is not particularly significant; English can amass about the same total:
  657. snow, sleet, slush, blizzard, flurry, avalanche, powder, hardpack,
  658. snowball, snowman, and other derivatives.
  659.  
  660. The Yup'ik total could be greatly expanded by other derived words, since
  661. the Inuit languages can form hundreds of words from a single root.  But
  662. this is true of all words in the language (and indeed of all agglutinative
  663. languages), not just the words for snow.
  664.  
  665.    "There's a town in Appalachia that speaks pure Elizabethan English."
  666.  
  667. There isn't.  All languages, everywhere, are constantly changing.  Some
  668. areas speak more conservative dialects, but we know of no case where 
  669. people speak exactly as their ancestors spoke centuries ago.
  670.  
  671. Of course, ancient languages are sometimes revived; biblical Hebrew has
  672. been revived (with some modifications) in modern Israel; and there's a
  673. village in India in which Sanskrit is being taught as an everyday
  674. language.  But these are conscious revivals of languages which have
  675. otherwise died out in everyday use, not survivals of living languages.
  676.  
  677.    "Chinese characters directly represent ideas, not spoken words."
  678.  
  679. Westerners have been taken by this notion for centuries, ever since
  680. missionaries started describing the Chinese writing system.  However, it's
  681. quite false.  Chinese characters represent specific Chinese words.  
  682.  
  683. (To be precise, almost all characters represent a particular syllable with
  684. a particular meaning; about 10% however represent one syllable of a 
  685. particular two-syllable word.)
  686.  
  687. The vast majority of characters consist of a _phonetic_ giving the
  688. approximate pronunciation of the word, plus a _signific_ giving a clue to
  689. its meaning (thus distinguishing different syllables having different
  690. meanings).  As an added difficulty, many of the phonetics are no longer
  691. helpful, because of sound changes since the characters were devised, over
  692. 2000 years ago.  However, it is estimated that 60% of the phonetics still
  693. give useful information about the character's pronunciation.
  694.  
  695. To be sure, Japanese (among other languages) uses Chinese characters too,
  696. and it is a very different language from Chinese.  However, we must look
  697. at exactly how the Japanese use the Chinese characters.  Generally they
  698. borrowed both the characters and the words represented; it's rather as if
  699. when we borrowed words like _psychology_ from Greek, we wrote them in the
  700. Greek alphabet.  Native Japanese words are also written using the Chinese
  701. characters for the closest Chinese words: if the Japanese word overlaps
  702. several Chinese words, different characters must be written in different
  703. contexts, according to the meanings in Chinese.
  704.  
  705. A good demythologizing of common notions about Chinese writing is found in
  706. THE CHINESE LANGUAGE: FACT AND FANTASY, by John DeFrancis (1984).
  707. ===============================================================================
  708. 17. Where can I get an electronic IPA font (also Cyrillic etc.)?
  709.                                                                   [--markrose]
  710.      [Adapted from information posted to sci.lang by Sean Redmond
  711.      and Evan Antworth.  If you know of other publically available (and+ 
  712.      legal) fonts or other linguistic resources, please e-mail me or post 
  713.      to sci.lang, so they can be listed here.]
  714.  
  715. * A number of Postscript Type 1 and TrueType fonts (including IPA, Greek,
  716.   Cyrillic, Armenian, etc.) are available by ftp from 
  717.  
  718.      host       ftp.cica.indiana.edu
  719.      directory: ftp/pub/pc/win3/fonts
  720.  
  721.   List (ls) the directory to see what's available.  The files are zipped; 
  722.   a version of unzip is usually available on whatever host you use 
  723.   to ftp with.
  724.  
  725.   Note: TrueType files can be used under Windows or on the Macintosh.
  726.   I'm not sure if the unzipped files can be inserted directly into the
  727.   Mac's Fonts folder; I ran them through Fontographer first.
  728.  
  729. * The SIL IPA fonts (also in PostScript Type 1 and TrueType versions)
  730.   are also available by ftp from
  731.  
  732.      host:      linguistics.archive.umich.edu [141.211.32.2]
  733.      directory: 
  734.         Windows version: /msdos/windows/fonts/truetype/sil-ipa12.exe
  735.         Mac version:     /mac/system.extensions/font/type1/silipa1.2.cpt.hqx
  736.  
  737. * They are also available on diskette for $5.00 plus postage: $2.00 in U.S. 
  738.   or $5.00 outside U.S. Order from:
  739.  
  740.      SIL Printing Arts Department
  741.      7500 W. Camp Wisdom Road
  742.      Dallas TX  75236   USA
  743.  
  744.      tel:    214-709-2495, -2440
  745.      fax:    214-709-3387.
  746.      e-mail: Margaret.Swauger@sil.org
  747.  
  748.